en_NZL_nzhera_int

Du 01 janvier 2014 au 30 juin 2015


Le média : Le Flux RSS :
NOM : New Zealand Herald URL du site : http://www.nzherald.co.nz/
TYPE : quotidien CATEGORIE : International
PAYS : NZL LANGUE : anglais

Statistiques sur les items “bruts” et dédoublonnés :


Items bruts : Items dédoublonnés : Doublon(s) :
Plus ancien item : 2014-01-01 Plus ancien item : 2014-01-01 Nb de doublons Titre : NA
Plus récent item : 2015-06-30 Plus récent item : 2015-06-30 Nb de doublons Description : NA
Total nombre de jour : 546 Total nombre de jour : 546 Doublons sur Titre et Description : NA
Total d’items : 92534 Total d’items : 91126 Total des doublons supprimés : 1408
Minimum d’items (jours) : 0 Minimum d’items (jours) : 0 Item(s) unique(s) :
Maximum d’item (jours) : 289 Maximum d’items (jours) : 286 Nb d’items uniques : 1309
Moyenne d’items (jours) : 169 Moyenne d’items (jours) : 167
Ecart-type (jours) : 64 Ecart-type (jours) : 63 Rupture(s) :
Min d’items (semaine) : 492 Min d’items (semaine) : 488 Nb de jours sans items : 15
Max d’items (semaine) : 2799 Max d’items (semaine) : 2772 Nb de période de rupture : 6
Moyenne d’items (semaine) : 1746 Moyenne d’items (semaine) : 1719 Plus longue rupture (en jours) 4
Ecart-type (semaine) : 689 Ecart-type (semaine) : 678 Plus courte rupture (en jours) 1

Items bruts = tous les items stockés de la base de données durant la pèriode choisie.


Items dédoublonnés = Items bruts - Doublons.


Doublons = Item RSS dont le titre+description est stricement identique à un autre, sur toute la période choisie.


Item Unique = Items pour lesquels au moins un doublon a été détecté et supprimé.


Ruptures journalières = Jours durant lesquels aucun item n’a été collecté. Elles sont soit “natuelles” soit “informatiques” (disfonctionnement de l’outil de collecte).



Nombre d’items “bruts” et dédoublonnés par jour

plot of chunk Items



Nombre de doublons détectés et supprimés

plot of chunk doublons



Moyenne mobile (7 jours) du nombre d’items “bruts” et dédoublonnés

plot of chunk MoyMobile



Cycle hebdomadaire des items “bruts”

Écart au nombre moyen d’items collectés par jour. Cycle calculé sur l’ensemble de la période, ruptures incluses

plot of chunk cycleHebdo1



Cycle hebdomadaire des items dédoublonnés

Écart au nombre moyen d’items collectés par jour. Cycle calculé sur l’ensemble de la période, ruptures incluses

plot of chunk cycleHebdo2



Contenu des items dédoublonnés :


Contenu du titre : Contenu de la description :
Nb de caractères min : 10 Nb de caractères min : 0
Nb de caractères max : 143 Nb de caractères max : 254
Nb de caractères moyen : 51 Nb de caractères moyen : 227
Nb de caractères médian : 49 Nb de caractères médian : 233
Ecart-type : 11 Ecart-type : 27
Nb Items sans titre : 0 Nb Items sans description : 31


Nombre de caractères dans le titre des items, par jour

plot of chunk titre



Nombre de caractères dans la descritpion des items, par jour

plot of chunk description



Résultat du taggage géographiques (dico PaysV4 ) des items dédoublonnés :


Statistiques sur le Geotaggage
Nb de GeoTAG Total : 72385 Nb de GeoTAG Unique : 197
Part d’items taggés : 65.2 % Moyenne de répétition des TAGs detectés : 367.4
Moyenne du Nb de TAG par item : 0.8 Mediane de répétition des TAGs detectés : 84
Mediane du Nb de TAG par item : 1 Ecart-type des répétitions des TAGs detectés : 1267.1
Ecart-type du Nb de TAG par item : 0.69 Minimum de répétitions des TAGs detectés : 1
Nb de TAG minimum par item : 0 Maximum de répétitions des TAGs detectés : 16675
Nb de TAG maximum par item : 5
Moyenne du Nb de TAG par jour : 136.3 Moyenne du Nb de TAG par semaine : 905
Mediane du Nb de TAG par jour : 1 Mediane du Nb de TAG par semaine : 947
Ecart-type du Nb de TAG par jour : 43.8 Ecart-type du Nb de TAG par semaine : 232
Nb de TAG minimum par jour : 3 Nb de TAG minimum par semaine : 205
Nb de TAG maximum par jour : 238 Nb de TAG maximum par semaine :1259

Items dédoublonnés = “items bruts - doublons”.


Items Geo-taggués. Il s’agit des items dans lesquels au moins un pays a été détécté automatiquement, en utilisant le ditionnaire " PaysV4 “.



Nombre d’items geo-taggués sur l’ensemble des items dédoublonnés

plot of chunk itemsTag



Liste et nombre des TAGs (les 50 plus cités) géographiques détectés

plot of chunk PaysTag



TAGs géographiques détéctés (les 50 plus cités) dans le temps

plot of chunk heatmap1



Répartition géographique des TAGs détectés

plot of chunk carteTagCumul



Cooccurrences des TAGs geographiques (dico PaysV4 ) :


Statistiques sur les Cooccurrences des TAGs Geographiques
Total des cooccurrences : 1.4019 × 104 Nb de cooccurrences Unique : 1512
Part des items geo-taggés comportant des cooccurrences : 20.2 % Rrépétition moyenne des cooccurrences : 9.3
Nb de cooccurrences moyen : 1.2 Mediane de répétition des cooccurrences : 2
Nb de cooccurrences médian : 1 Ecart-type des répétitions des cooccurrences : 33.9
Ecart-type du Nb de cooccurrences : 0.63 Minimum de répétitions des cooccurrences : 1
Nb de cooccurrences minimum : 1 Maximum de répétitions des cooccurrences : 624
Nb de cooccurrences maximum : 10
Nb de cooccurrences moyen par jour : 26.5 Moyenne du Nb de cooccurrences par semaine : 175
Nb de cooccurrences médian par jour : 1 Mediane du Nb de cooccurrences par semaine : 176
Ecart-type du Nb de cooccurrences par jour : 12.5 Ecart-type du Nb de cooccurrences par semaine : 56
Minimum de cooccurrences par jour : 1 Nb de cooccurrences minimum par semaine : 46
Maximum de cooccurrences par jour : 72 Nb de cooccurrences maximum par semaine :289

Items Geo-taggués. Il s’agit des items dans lesquels au moins 1 pays a été détécté automatiquement, en utilisant le ditionnaire " PaysV4 “.


Items co-taggués.Il s’agit des items dans lesquels au moins 2 pays ont été détéctés automatiquement, en utilisant le ditionnaire " PaysV4 “.



Nombre d’items Geo-taggés comportant des cooccurrences

plot of chunk itemscoTag



Liste et nombre des cooccurrences de Geo-tags trouvés

plot of chunk PayscoTag



Coocurrence des TAGs géographiques détéctés (les 50 plus cités) dans le temps

plot of chunk heatmap2



Cocitations de pays - Graphe des flux dominants

Pays dominants. Le nombre total de co-citations est supérieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays intermediaires. Le nombre total de co-citations est supérieur ou inférieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays Dominés. Le nombre total de co-citations est inférieur aux nombre total de co-citations de chaque pays avec lesquels il est co-cité


plot of chunk graphe1



Résultat du taggage de l’événement “Ebola” dans les items dédoublonnés :


Statistiques sur le taggage de l’événement “Ebola”
Nb d’item taggués : 1456 Nb de périodes avec au moins un item taggué par jour : 7
Part d’items taggés : 1.6 % Plus longue période avec au moins un item taggué : 153 jour(s)
Nb de TAG minimum par jour : 8 Plus courte période avec au moins un item taggué : 2 jour(s)
Nb de TAG maximum par jour : 286
Nb de TAG maximum par semaine :1514
Nb de TAG minimum par semaine :263

Items dédoublonnés = “items bruts - doublons”.


Items taggués par l’événement . Il s’agit des items dans lesquels au moins un mot du dico " Ebola " a été détécté automatiquement.



Nombre d’items taggués avec le dico “Ebola” sur l’ensemble des items dédoublonnés

plot of chunk itemsTagEvent



Fréquence cumulée des items taggués avec le dico “Ebola” sur l’ensemble des items dédoublonnés

plot of chunk itemsTagEventCumul



Liste et fréquence des pays co-taggués avec l’événement “Ebola”

plot of chunk PaysTagEvent



Co-citation de TAG géographique & de l’événement “Ebola” dans les items

plot of chunk heatmap3



Co-citation de pays & “Ebola”. Graphe des flux (ou noeuds) dominants

Pays dominants. Le nombre total de co-citations est supérieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays intermediaires. Le nombre total de co-citations est supérieur ou inférieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays Dominés. Le nombre total de co-citations est inférieur aux nombre total de co-citations de chaque pays avec lesquels il est co-cité


plot of chunk graphe2